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音乐 协和 性 的 影响 因素 及 其 神经 机 制 | 
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摘要 音乐 是 高 级 意识 活动 产生 


的 核心 要 素 ， 协 和 性 的 形成 原 至 


张 航 


的 声音 艺术 , 对 人 类 的 情感 表达 和 交流 具有 于 


至 今 仍然 未 有 定 


听 起 来 协和 (愉悦 )， 一 些 和 声 听 起 来 不 协和 (不 愉悦 )? 协和 感 完 竟 是 


美体 验 ? 从 古 希 腊 时 代 至 今 ， 


n 张 积 家 ? 


学 部 ， 广 西 桂林 ，541004) 


EE 要 意义 。 作 为 连接 音乐 与 情绪 


论 。 人 类 如 何 加 工 多 个 音符 构成 的 和 声 ? 为 什么 一 些 和 声 


这 些 问 题 就 一 直 吸 引 着 学 者 的 目光 。 物 理学 家 从 协和 与 不 协和 的 声学 区 别 中 


自 下 而 上 的 声学 感知 还 是 自 上 而 下 的 审 


寻找 答案 ， 生 理学 家 从 听觉 生理 机 制 方面 分 析 协 和 感 的 产生 ， 心 理学 家 研究 协和 音程 偏好 是 与 生 俱 来 的 还 


是 后 天 形成 的 。 


的 实证 研究 。 


关键 词 音乐 协和 性 ， 和 谐 性 ， 拍 频 ， 
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前 ， 音 乐 协 和 性 


的 理论 内 容 主 


音乐 文化 ， 


H 


认 知 机 制 


进行 有 意识 编排 才能 够 创造 出 优美 的 旋 入 
音 事件 处 理 能 力 的 重要 标志 。 
学 证 据 显 示 ， 人 类 至 少 在 35000 年 前 的 旧 石器 时 代 就 能 够 制作 并 且 使 


2009; Killin, 2018)。 作 为 人 类 的 通 


中 (Mehr et al., 2019)。 作 为 情感 交流 的 艺术 载体 ， 


乐 ， 都 是 人 类 释放 情感 和 引发 共鸣 的 重要 方式 (Belfi et al., 2021)。 音 乐 对 人 类 的 非 几 意 义 使 


nor 
o 


要 以 西方 音乐 为 主 ， 中 国 传统 民族 音乐 迫切 需要 开展 相关 


音乐 是 经 由 人 类 意识 活动 产生 的 声音 组 合 的 高 级 艺术 , 只 有 对 声音 的 频率 和 节奏 等 信息 


因此 ， 创 作 、 演 奏 或 聆听 音乐 是 人 类 具有 复杂 声 


作为 人 类 的 特有 才能 ， 音 乐 活动 贯穿 人 类 文明 史 的 始终 。 考 证 


pi 
Jla A o 


Sac 


乐器 (Conard et al., 


音乐 存在 于 所 有 的 文明 社会 (有 文字 的 或 无 文字 的 ) 
音乐 伴随 着 人 的 一 生 ， 从 摇篮 曲 到 葬礼 哀 


得 许多 学 科 都 重视 对 音乐 基础 理论 的 研究 。Science 在 创刊 125 周年 之 际 ， 就 将 音乐 和 语言 


的 起 源 列 为 125 个 最 具 挑 战 怕 


E 的 科学 问题 之 一 (Kennedy & Norman, 2005). Nature 也 以 “ 科 


学 与 音乐 ”为 专题 ,探讨 音乐 理论 与 实践 ' 


论 核心 


琢 待 解决 的 重要 问题 ， 


音乐 的 协和 性 (musical consonance)(Ball, 2008). 


包括 现代 和 声音 乐 学 的 理 


协和 性 是 音乐 构建 的 基本 要 素 。 无 论 何 种 音乐 形式 或 题材 ， 都 由 音符 组 成 ， 音 符 同 时 发 
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声 形成 和 声 (harmony)， 相 继 发 声 构 成 旋律 (melody)。 音乐 协和 性 是 两 个 或 两 个 以 上 音符 同时 


演奏 时 所 引发 的 心理 感受 (McDermott et al., 2016; Parncutt & Hair, 2011; Zentner & Kagan, 
1996)。 根 据 演 奏效 果 ， 可 以 将 和 声 分 为 两 类 ， 听 起 来 愉悦 、 稳 定 或 彼此 融合 的 和 声称 作协 
和 音程 (consonant interval) 或 协和 和 弱 (consonant chord)， 听 起 来 不 愉悦 、 不 稳定 或 彼此 不 融 
合 的 和 声称 作 不 协和 音程 (dissonant interval) 或 不 协和 和 弦 (dissonant chord)( Harrison & Pearce, 
2020; McDermott et al., 2016)。 迄 今 为 止 ， 已 经 有 大 量 的 理论 试图 说 明 音 乐 中 存在 协和 与 不 
协和 两 种 音响 效果 的 原因 ， 但 都 存在 着 较 大 的 争议 。 这 些 理论 可 以 归纳 为 三 种 ( 见 表 1): (1) 
强调 音乐 刺激 的 物理 属性 , 认为 和 声音 程 的 声学 特征 是 影响 音乐 协和 性 的 主要 因素 , 主张 总 
结 出 人 类 普遍 遵循 的 数理 规律 ; 2) 侧 重 于 考察 音乐 加 工 的 生理 属性 和 心理 属性 , 认为 音乐 协 
和 感 是 声音 事件 在 听觉 通道 诱发 的 情绪 体验 , 主张 采用 生理 声学 实验 和 心理 声学 实验 揭示 出 
这 种 普遍 的 听觉 加 工 机 制 。 这 两 种 理论 不 约 而 同 地 认为 , 音乐 协和 性 的 感知 能 力 是 人 类 与 生 
和 具 来 的 天 赋 才 能 。(3) 聚 焦 音 乐 的 文化 属性 ， 认 为 音乐 协和 性 知觉 是 后 天 形成 的 审美 经 验 ， 受 
文化 旺 陶 和 音乐 训练 影响 。 本 文 以 上 述 三 种 理论 为 脉 腹 ,介绍 不 同学 科 的 成 果 , 阐明 人 类 音 
乐 协和 感 的 形成 原理 和 认 知 机 制 , 为 未 来 的 相关 研究 尤其 是 中 国民 族 音乐 协和 性 的 理论 研究 


ran 


if 
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提供 启示 。 
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R1 音乐 协和 性 的 相关 理论 


假设 观点 影响 因素 基本 理论 相关 文献 


< 音符 之 间 的 数理 规律 同时 响起 的 音符 之 间 音 高 之 比 越 简 单 , 声音 整体 听 起 来 越 协 Crocker, 1963; Palisca, 1961 
© 和 
= 泛音 列 的 和 谐 性 音乐 协和 性 是 基于 纵向 受 置 的 声学 特征 在 多 大 程度 上 近似 ”Bowling et al., 2018; Gill & Purves, 2009; 
<= 一 个 和 谐 的 自然 泛音 列 McDermott et al., 2010 
© 
PERN 人 耳 的 生理 机 制 不 协和 音程 的 泛音 周期 性 差 , 频谱 分 布 不 均匀 ， 导致 频率 过 Greenwood, 1961; Helmholtz, 1885; Lots & 
EW v ere ya Si 
E 于 接近 的 泛音 列 之 间 会 在 基底 膜 引起 拍 频 效 应 , 从 而 引发 不 Stone, 2008; Plomp & Levelt, 1965 
愉悦 的 粗糙 感 体 验 
比较 心理 学 (动物 行为 研究 ) ”音乐 协和 性 偏好 受到 听觉 加 工 系 统 约束 , 具有 重要 的 生物 学 ”Fishman et al., 2001; Hoeschele et al., 2012; 
意义 Izumi, 2000; McKinney et al., 2001 
认 知 神经 机 制 皮层 和 皮层 下 水 平 的 神经 通路 对 和 谐 泛 音 特征 存在 编码 优 Bidelman,，2013; Bidelman & Krishnan, 
势 。 2009; Itoh et al., 2010; Gold et al., 2019 
毕生 发 展 ( 先 天 ) 音乐 协和 性 偏好 是 与 生 俱 来 的 知觉 能 力 Virtala et al., 2013; Zentner & Kagan, 1996 
毕生 发 展 ( 后 天 ) 音乐 协和 性 是 后 天 习 得 的 音乐 审美 经 验 Plantinga & Trehub, 2014; Weiss et al., 2020 
环境 决定 论 
文化 因素 音乐 协和 性 知觉 存在 文化 差异 Ambrazevitius, 2017; McDermott et al., 


2016 


音乐 训练 音乐 训练 对 音乐 协和 性 知觉 具有 重要 的 塑造 作用 Foss et al., 2007; Minati et al., 2009 


交互 作用 论 “多 因素 混合 理论 泛音 和 谐 性 、 拍 频 效 应 和 文化 各 陶 共同 影响 音乐 协和 性 知觉 Harrison & Pearce, 2020; Parncutt & Hair, 
2011 


2 音乐 协和 性 的 数理 之 美 

音乐 是 一 门 艺术 , 但 当 人 们 研究 其 原理 、 分 析 其 性 质 、 发 现 其 规则 时 , 就 成 为 一 门 科学 。 

音乐 协和 性 理论 的 发 展 正 是 基于 对 音乐 美学 的 不 懈 追 求 , 这 从 根本 上 推动 了 人 类 使 用 理性 的 

目光 审视 其 背后 的 奥秘 ,探测 隐藏 于 音符 间 微妙 的 数理 关系 。 从 数理 角度 探讨 音乐 协和 性 的 
人 


理论 主要 包括 简单 整数 比 学 说 (Small-Integer Ratios Theory) 和 泛音 和 谐 理 论 (Harmonicity 


Theory)。 
2.1 简单 整数 比 学 说 

音乐 协和 性 的 早期 研究 可 以 追溯 至 古 希腊 时 期 。 毕 达 哥 拉 斯 是 第 一 个 触及 该 领域 的 学 者 。 
他 发 现 ， 同 时 拨 动 的 两 条 琴 弦 长 度 之 比 越 简单 ， 和 声效 果 越 协和 ， 弦 长 之 比 越 复杂 ， 和 声效 
果 越 不 协和 (Crocker, 1963; Purves 2017)。 据 此 ， 把 弦 长 关系 1: 2( 纯 八 度 )、2: 3( 纯 五 度 ) 和 3: 
4( 纯 四 度 ) 的 音响 组 合 划 定 为 协和 一 致 的 愉悦 音程 ， 并 从 和 谐 哲 学 观念 赋予 这 些 数值 以 特殊 
象征 含义 一 一 “ 圣 十 结构 ”(Tetractys, 10=1+2+3+4)， 认 为 美的 事物 总 是 有 类 似 简单 且 和 
谐 的 数学 特征 , 甚至 将 “ 数 ” 视 为 万 物 之 源 , 宇宙 和 谐 本 质 上 是 “ 数 ” 的 和 谐 (Bowling & Purves, 
2015; Crocker, 1963; Primavesi, 2016)。 简 单 整数 比 学 说 提出 促进 了 音乐 协和 性 的 数理 规律 研 
Feo 尤其 是 在 文艺 复兴 时 期 , 大量 作 曲 家 在 简单 整数 比 思想 指导 下 探索 协和 性 的 规律 ， 以 丰 
富 协 和 音程 与 和 弦 的 数量 。 意 大 利 作 曲 家 扎 利 诺 用 “六 数列 ”来 说 明 协 和 性 的 产生 原则 (6= 
1+2+3=1x2x3)， 认 为 所 有 的 协和 音程 都 由 1 到 6 几 个 数字 组 成 (Bowling & Purves, 2015; 
Palisca, 1961; Sukljan, 2020), 从 而 把 原来 一 直 被 毕 氏 学 派 看 作 是 不 协和 音程 的 6: 5( 小 三 度 )、 
5: 4( 大 三 度 ) 和 5: 3( 大 六 度 ) 调 整 至 协和 音程 范畴 ， 为 推动 和 声音 程 系统 分 类 做 出 重要 贡献 
(Tenney, 1988)。 至 此 ， 现 代 和 声音 乐 学 中 协和 音程 和 不 协和 音程 基本 确立 。 

音乐 形式 的 易 故 革新 和 音乐 种 类 的 丰富 多 彩 表 明 , 音乐 极 具 有 社会 历史 性 和 文化 多 样 性 。 
但 是 , 通过 比较 不 同时 期 甚至 是 不 同 地 区 的 研究 发 现 ， 人 对 音程 协和 性 的 感知 偏好 存在 着 极 
高 的 相似 性 (图 1a)， 且 极度 符合 简单 整数 比 学 说 ,听众 普遍 地 将 比值 简单 的 音符 组 合 评定 为 
协和 音程 ,将 比值 复杂 的 音符 组 合 评定 为 不 协和 音程 。 这 说 明 , 数理 思想 对 解释 协和 性 仍然 
有 共有 较 强 的 现实 意义 。 即 便 在 今天 , 没有 一 种 理论 能 够 像 简单 整数 比 说 那样 对 音乐 艺术 产生 
如 此 大 的 影响 。 由 此 也 引发 一 个 关键 性 的 疑问 ， 为 什么 比值 简单 的 和 声 听 起 来 协和 ? 


2. 2 泛音 和 谐 理论 
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声音 科学 的 诞生 为 解答 和 声 协和 性 提供 了 新 的 思考 方式 。 首 先 ， 声 音 是 一 种 机 械 振动 ， 
振动 频率 决定 音 高 , 所 以 , 影响 音乐 协和 性 的 本 质 因素 是 弦 振 动 频 率 比 而 非 弦 长 比 (Konoval， 
2018)。 其 次 ， 泛 音 (overtones) 作 为 最 基本 的 声学 现象 是 音乐 协和 性 形成 的 物理 基础 (Pesic， 
2014)。 因 为 传统 乐器 或 人 发 出 的 声音 都 是 复合 音 ， 除 了 能 够 听 到 一 个 响亮 的 基 音 音 高 外 ， 

能 够 听 到 一 系列 相对 柔弱 却 悦耳 协和 的 “ 弦 外 之 音 ”(Dostrovsky, 1975; Konoval, 2018)。 以 
时 想 的 弦 振 动 为 例 ( 图 1b), 被 拨 动 的 琴 弦 同时 做 整 段 振动 和 局 部 振动 (二 分 之 一 、 三 分 之 一 、 
四 分 之 一 …)， 整 段 振动 产生 清楚 响亮 的 基 音 (fundamental tone), 分 段 振动 产生 了 一 系列 整数 


ie 


倍 于 基 音 频率 (简称 基 频 ，frequency fundamental) 的 泛音 。 泛音 现象 发 现 为 数学 和 音乐 学 之 间 
搭建 了 桥梁 , 包括 拉 莫 在 内 的 许多 音乐 学 家 主张 运用 声学 理论 而 非 纯 粹 数学 来 研究 音乐 协和 
性 。 拉 莫 认 为 ， 在 自然 泛音 Catural harmonics) 中 包含 许多 协和 音程 ， 构 成 协和 音程 的 泛音 列 


(a) 不 协和 音程 协和 音程 (9 


IW sy 


bald 


三 全 音 Tritone (A + Eb) 纯 五 度 P5 (A +E) 


泛音 列 


Magnitude 
Magnitude 


==- 美国 === AA -== 德国 110 220 330 440 550 660 55 110 220 330 440 550 660 


ome ati === gms m WEK AUE RESEO) Frequency (Hz) 


(d) 


Basilar Membrane 
Basilar Membrane 


拍 频 (Beating) 


图 1a. 从 1898 年 至 2020 年 间 ， 来 自 6 个 国家 受 试 者 对 12 个 和 声音 程 音 乐 协和 性 的 等 级 排列 结果 高 度 一 


致 ,数据 分 别 选 自 : 美国 (Guernsey, 1928), 日 本 (Butler & Daston, 1968), 德国 (Stumpf, 1898), 英国 (Pear 1911), 


新 加 坡 (Bowling & Purves, 2015)， 加 拿 大 (Weiss etal., 2020)。 图 1b. 吉他 琴 弦 振动 产生 的 泛音 列 。 图 lc. tp 


= 


和 音程 ( 纯 五 度 ) 和 不 协和 音程 (三 全 音 ) 的 频谱 示意 


,绿色 实 线 代表 根 音 音符 A 的 频率 成 分 , 基 频 是 110Hz， 


泛音 是 220,， 330, 440,， 550，660Hz 等 。 三 全 音 中 红色 虚线 代表 冠 音 音符 Eb， 基 频 是 136Hz, 泛音 是 312, 


468，624，780，936Hz 等 。 纯 五 度 中 红色 虚线 代表 冠 音 音符 了， 基 频 是 165SHz， 泛 音 列 是 330，495，660， 


852Hz 等 。 黑色 虚线 代表 纯 五 度 的 虚拟 音 高 。 图 1d. 基 底 膜 上 拍 频 效 应 的 示意 图 。 拍 频 效应 通常 由 泛音 列 过 


于 接近 的 不 协和 音程 引发 。 
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与 基 音 距离 更 近 ， 听 起 来 更 清晰 ， 构 成 不 协和 音程 的 泛音 列 距离 基 音 较 远 ， 不 容易 被 察觉 
(Christensen, 2004; Kieffer, 2016)， 如 表 2 所 示 ， 离 基 音 较 近 的 几 个 泛音 无 论 是 与 基 音 的 音程 
关系 还 是 与 前 一 个 泛音 的 音程 关系 都 非常 协和 ， 表 明和 谐 的 泛音 列 本 身 就 是 一 个 协和 和 弦 
(chord)。 所 以 ， 简 单 整数 比 的 音乐 审美 倾向 在 一 定 程度 上 反映 了 人 类 对 自然 和 谐 泛音 的 知觉 
偏好 ， 当 两 个 音 被 同时 演奏 时 ， 其 炙 加 形成 的 声学 特征 在 泛音 关系 上 越 和 谐 ， 构 成 的 声音 织 
体 就 越 协 和 。 


表 2 自然 倍 音 列 中 基 音 与 泛音 之 间 的 协和 关系 


与 基 音 与 前 一 泛 

名 称 的 关系 与 基 音 的 音程 关系 协和 性 ”” 音 的 关系 ”音程 名 称 ”协和 性 
基 音 1:1 纯 一 度 Ç 1:1 纯 一 度 C 
第 一 泛音 2:1 纯 八 度 C 2:1 纯 八 度 C 
第 二 泛音 3:1 纯 八 度 + 纯 五 度 C 3:2 纯 五 度 C 
第 三 泛音 4:1 纯 八 度 + 纯 八 度 C 4:3 纯 四 度 C 
第 四 泛音 5:1 纯 八 度 + 纯 八 度 + 大 三 度 C 5:4 大 三 度 C 
第 五 泛音 6:1 纯 八 度 + 纯 八 度 + 纯 五 度 C 6:5 小 三 度 C 
第 六 泛音 fal 纯 八 度 + 纯 八 度 + 小 七 度 D 7:6 无 该 音程 ae 
第 七 泛音 8:1 纯 八 度 + 纯 八 度 + 纯 八 度 C 8:7 无 该 音程 nee 
第 八 泛音 9:1 三 个 纯 八 度 + 大 二 度 D 9:8 大 二 度 D 
第 十 五 泛音 16:1 四 个 纯 八 度 C 16:15 小 二 度 D 


注 : C 代表 协和 英文 缩写 “consonance”, D 代表 不 协和 英文 缩写 “dissonance”. 


人 类 对 和 谐 泛 音 的 偏好 可 能 是 一 种 适应 性 的 加 工 机 制 ， 并 且 有 重要 的 进化 意义 。 因 为 
人 类 的 嗓音 、 大 多 数 动物 的 叫 声 以 及 物体 的 有 规则 振动 都 产生 与 基 音 呈 倍 频 关 系 的 和 谐 泛 音 
特征 (嗓音 称 共振 峰 , formants)， 这 些 声音 也 是 社交 、 择 偶 或 生存 警示 意义 的 凸显 性 信和 号 
(Bowling, etal.,2017). ATLA, 在 自然 选择 压力 下 ， 人 类 进化 出 了 一 套 可 以 解析 和 谐 泛 音 的 听 
觉 系 统 ， 能 够 在 纷 系 无 序 的 声音 世界 中 迅速 地 分 辨 泛音 有 序 的 重要 信息 。 研 究 发 现 ， 嗓 音 作 
为 生物 学 意义 极 高 的 听觉 刺激 是 有 效 地 预测 音乐 协和 性 的 指标 , 那些 与 嗓音 频谱 特征 相似 的 


和 弱 听 起 来 更 协和 (Bowling et al., 2018; Gill & Purves, 2009)， 说 明 相 较 于 泛音 无 序 的 噪音 ， 
人 类 大 脑 更 容易 处 理 嗓 音 般 的 和 谐 声响 进而 引发 积极 的 情绪 体验 。 嗓音 被 喻 为 人 类 的 “听觉 
TfL”, 闻 声 数秒 ， 就 能 够 迅速 地 获取 对 方 的 性 别 、 身 份 、 情 绪 、 吸 引力 甚至 是 体型 大 小 等 
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言 息 (Pisanski & Feinberg, 2019)。 对 嗓音 相似 特征 的 加 工 优势 (processing advantage) 是 人 脑 的 


预 装 机 制 (Bowling & Purves, 2015; Harrison & Pearce, 2020)。 不 仅 如 此 ，Schwartz 等 人 (2003) 
对 上 千 段 语音 材料 进行 特征 提取 后 发 现 ， 人 类 言语 信息 的 振幅 -频率 分 布 模式 恰好 对 应 于 音 
程 协 和 度 的 等 级 顺序 , 表明 人 类 在 言语 特征 上 的 统计 知觉 经 验 训 练 了 人 耳 对 特定 频率 比 的 音 
程 协和 感 。 和 谐 泛 音 偏好 也 可 能 发 纠 于 人 类 对 于 大 自然 和 谐音 响 法 则 的 崇尚 与 追求 。 例 如 ， 
大 三 和 弦 产 生 就 是 源 于 对 自然 泛音 的 观察 (Christensen, 2004), 西方 五 度 相 生 律 和 中 国 三 分 损 
益 律 的 建立 也 受 自然 泛音 的 启发 , 甚至 最 初 的 音乐 形式 就 是 人 类 对 大 自然 声音 律动 的 倾听 和 
模仿 ( 王 小 盾 ,2017)。《 淮 南 子 》 中 有 :“ 乐 生 于 音 ， 首 生 于 律 ， 律 生 于 风 ， 此 声 之 宗 也 。” 大 
自然 的 风 叭 雨 落 、 鸟 叫 虫 鸣 极 可 能 是 人 类 形成 和 谐音 响 审 美 法 则 的 最 初 灵感 来 源 。 

但 是 , 持 信息 加 工 观点 的 研究 者 却 认为 , 泛音 作为 物理 特征 所 以 引发 协和 性 的 情绪 体验 
主要 与 音 高 的 表征 机 制 有 关 (McLachlan, etal., 2013)。 音 高 是 乐音 (物体 有 规则 振动 产生 ) 的 基 
本 听觉 属性 ， 对 音 高 的 感知 是 理解 音乐 和 语言 的 重要 媒介 (Norman-Haignere et al., 2019)。 通 


常 说 来 ， 音 高 由 基 音 决定 ， 但 多 声 源 复合 信号 的 音 高 知觉 就 变 得 复杂 并 受 泛 音信 息影 响 


(Harrison & Pearce, 2020; Oxenham, 2018; Popham et al., 2018)。 呈 倍 频 关系 的 基 音 和 泛音 被 
自动 地 知觉 为 来 自 同 一 声 源 ， 基 音 决 定 音 高 ,泛音 影响 音色 ， 但 不 具 和 谐 关 系 的 声音 由 于 无 
法 被 听觉 系统 有 效 地 分 辨 ,会 造成 知觉 不 流畅 的 不 愉悦 体验 。 研究 证 实 , 听 者 对 协和 音程 与 
不 协和 音程 的 音 高 知觉 水 平 存在 着 差异 ， 大 脑 对 不 协和 音程 的 音 高 编码 比 协和 音程 慢 
36ms(Tabas etal., 2019)。 在 不 协和 音程 中 完成 音 高 匹配 的 错误 率 更 高 ， 反 应 时 更 长 ， 说 明 大 
脑 并 不 擅长 处 理 泛 音 不 和 谐 的 声音 (Seror & Neill, 2015)。 甚 至 在 不 协和 音乐 背景 中 进行 
Stroop 任务 时 ， 由 不 一 致 条 件 引 起 的 冲突 效应 增加 ， 表 明 不 和 谐 泛 音 会 占用 大 量 的 认 知 资源 


并 且 影 响 听 者 的 执行 功能 (Bonin & Smilek, 2016; Masataka & Perlovsky, 2013; Seror & Neill, 


上 


2015)。 而 且 ， 模式 匹配 理论 (Pattern Matching Theory) 和 时 域 自 相关 理论 (Temporal 


Autocorrelation Theory) 还 强调 , 泛音 和 谐 性 影响 音 高 表征 的 准确 度 进 而 引发 音乐 协和 性 的 知 


觉 体验 (De Cheveigne, 2005; Harrison & Pearce, 2020; McDermott & Oxenham, 2008)。 模 式 匹 
配 理论 认为 ， 长 时 记忆 储存 和 谐 泛音 的 频谱 特征 ， 如 果 听 觉 信息 与 之 吻合 ,即便 基 音 缺失 了 
(fundamental missing)， 大 脑 也 能 够 自动 地 利用 泛音 与 基 音 的 倍 频 关 系 补 全 并 感知 到 音 高 
(Feng & Wang, 2017; Oxenham, 2018)。 所 以 ， 和 谐 泛 音 的 音 高 知觉 起 来 清晰 明确 ， 不 和 谐 泛 
音 在 匹配 中 会 出 现 多 个 “虚拟 音 高 ”(virtual pitch)， 从 而 造成 音 高 不 可 辨 的 杂乱 音响 (Milne et 
al., 2016; Parncutt & Hair, 2011; Stolzenburg, 2015)。 如 图 1c 所 示 ， 协 和 音程 P5( 纯 五 度 ) 的 泛 


音 列 和 谐 度 较 高 , 因而 有 明确 的 音 高 值 (FE0 等 于 原来 两 个 泛音 列 的 最 大 公约 数 ), 不 协和 音程 


202110.00063v1 


chinaXiv 


Tritone( 三 全 音 ) 的 泛音 列 错落 不 均 ， 无 法 被 听觉 系统 有 效 地 处 理 ， 所 以 引起 不 愉悦 的 体验 。 
因此 ， 音 高 知觉 流畅 性 是 引起 音乐 协和 感 的 重要 原因 。 时 域 自 相关 理论 认为 ， 听觉 系 统 根据 
声波 在 时 域 上 的 周期 性 变化 来 表征 泛音 的 和 谐 性 ， 并 且 以 求 最 小 正 周 期 的 方式 推测 音 高 值 。 
比值 复杂 的 不 协和 音程 由 于 自 相 关系 数 低 导 致 泛音 列 的 周期 性 差 。 例如, 小 二 度 产 生 的 几 个 
虚拟 音 高 值 甚至 低 于 人 类 的 乐音 感知 阔 限 (30Hz)(McDermott & Oxenham, 2008)。 实 际 上 ， 两 
种 理论 争论 的 焦点 在 于 听觉 系统 计算 音 高 的 方式 , 根据 傅 里 叶 变 换 原理 , 声波 在 时 域 上 的 周 
期 性 等 价 于 在 频 域 上 的 和 谐 性 , 但 两 种 理论 在 音 高 知觉 流畅 性 是 引发 音乐 协和 性 的 观点 上 并 
无 分 歧 。 

总 的 来 说 ，17 世纪 的 科学 革命 促进 了 物理 声学 发 展 ， 在 实证 主义 思想 推动 下 ， 研 究 者 
开始 将 目光 从 数理 哲学 转向 声学 , 发 现 泛音 与 音乐 协和 性 的 联系 , 逐渐 形成 了 泛音 和 谐 性 理 


论 。 
3 音乐 协和 性 的 感知 之 美 

声学 的 物理 特征 是 导致 声音 协和 与 否 的 外 在 条 件 ， 人 耳 如 何 感知 声学 线索 才 是 引发 音 
乐 协和 性 的 关键 。 协 和 性 归根 结 底 是 人 类 的 听觉 体验 。 所 以 ， 到 19 世纪 ， 部 分 学 者 开始 研 
究 音乐 引起 的 生理 -心理 反应 机 制 ， 而 非 只 关注 物理 现象 。 赫 尔 姆 起 效 就 是 这 一 领域 的 先驱 
者 ， 他 提出 的 拍 频 理论 (Beat Theory) 目 前 仍然 是 现代 音乐 学 教材 中 普遍 推崇 的 观点 。 
3. 1 拍 频 理 论 
在 音乐 知觉 测量 中 , 赫 尔 姆 霍 兹 同样 意识 到 泛音 特征 的 重要 , 但 并 未 像 拉 莫 等 人 一 样 把 
音程 协和 性 看 作 是 泛音 列 的 和 谐 自然 , 而 是 转向 研究 泛音 之 间 的 相互 作用 及 对 听觉 系统 的 影 
响 (Bowling & Purves, 2015)。 他 认为 ,“ 自 然 泛 音 之 和 谐 只 能 称 叹 宇宙 法 则 之 神奇 ， 再 无 它 
] ， 因 为 自然 界 中 美 与 丑 的 存在 概率 相同 ， 事 物 的 自然 性 并 不 足以 证 明 它 是 精美 的 。 相 反 ， 
一 些 音 程 之 所 以 不 协和 是 因为 听 起 来 杂乱 刺耳 , 其 原理 是 两 个 频率 相近 的 声波 相遇 时 会 发 生 
干涉 效应 ， 出 现 振 幅 涨 落 、 强 弱 不 均 的 拍 频 现象 ， 由 此 引起 基底 膜 上 听觉 感受 器 的 间 敬 性 兴 
奋 从 而 导致 不 舒服 之 感 ”(Helmholtz, 1885)。 这 种 令 人 不 愉悦 的 体验 可 以 定义 为 粗糙 感 
Goughness)。 粗 糙 感 影响 音程 协和 性 。 和 声 听 起 来 协和 是 因为 粗糙 感 不 明显 ， 听 起 来 不 协和 
是 因为 粗糙 感 明显 (如 图 1d 所 示 ， 在 不 协和 音程 三 全 音 中 ， 频 率 相 近 的 泛音 列 在 基底 膜 相 应 
位 置 引 发 了 拍 频 效 应 )。 所 以 ， 音 程 使 用 应 该 遵循 简单 整数 比 原则 ， 防 止 泛音 过 于 紧凑 引起 
明显 的 粗糙 感 。 


拍 频 理 论 提 出 后 , 大 量 的 生理 声学 和 心理 声学 的 实验 结果 都 相继 文 持 了 这 一 假设 。 贝 凯 


H 
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ARER 


位 置 理论 Ws ALPE ACH, 耳蜗 
不 同位 置 的 响应 。 这 3 


声学 数据 可 以 直 


究 对 推动 拍 频 生理 机 制 探索 具有 里 程 碑 的 意义 (Von Békésy, 1960)。 基 于 听觉 
基底 膜 以 行 波 的 形式 振动 ， 不 同 的 声波 频率 分 别 对 应 于 基底 膜 
页 工作 不 仅 令 他 获得 了 1961 年 诺 贝尔 生理 与 医学 奖 ， 更 让 大 量 的 心理 


接 与 基底 膜 振动 图 谱 数 据 比较 (Bowling & Purves, 2015)。 在 比较 中 ， 研 究 者 


发 现 , 耳蜗 就 像 是 一 个 天 然 的 分 频 滤波 器 ， 上 
范围 的 听觉 感受 占 ， 当 两 个 声波 频率 相近 时 ,激励 的 感受 器 
受到 双 音 拍 频 效应 影 
完 者 将 出 现 粗 糙 感 的 频率 差 值 范围 称 为 临界 频带 (critical bands), 
波 的 频率 刚好 落 在 相同 临 春 频带 内 就 会 引起 粗糙 感 , 落 在 临界 频带 外 就 不 引起 粗 


重合 区 域 就 会 


Schneider 2018)。 


如 果 两 个 声 


因此 , 4 


布 满 了 一 


系列 相互 交合 的 负责 响应 特定 频率 


范围 有 很 大 


向 引起 粗糙 感 (Greenwood，1961; Vassilakis, 2005; 


糙 感 (Greenwood, 1991; Plomp & Levelt, 1965; Vassilakis, 2005)。 例 如 ， 同 时 呈现 两 个 频率 值 


Wy fly 户 V1> 户 的 纯音 


(EW), REMERA 


sin(2mf1t) + sin(27f2t) 


根据 和 差 化 积 公式 ， 上 式 也 可 变 为 : 


2sin (2r 2 t) co 


s (2r L220) 


号 可 表示 为 : 
(1) 


(2) 


当 双 音 之 间 的 频率 差 值 足够 大 时 , 听 者 知觉 到 的 是 公式 (1), 此 时 仍然 是 两 个 清晰 可 辨 的 频率 


W fly f2 的 声 
加 信号 以 频率 为 


=0.1-5Hz) 在 响 度 上 不 会 


; 但 当 双 音 只 有 较 小 的 频率 差 值 时 , 听 者 所 知觉 到 的 是 公式 (2), IN 


(f1+f2) 2， 振 幅 涨 落 为 Af=f1 - 2 的 方式 振动 。 
被 知觉 为 不 愉悦 ， 甚 至 听 起 来 像 一 


个 融合 音 (fusion)， 但 快速 


其 中 ， 较 慢 的 振幅 涨 落 (Af 


振荡 的 


振幅 涨 落 (Af= 20-250Hz) 会 引起 忽 强 忽 弱 的 刺耳 拌 动 (Harrison & Pearce, 2020; Lots & Stone, 


2008)。 所 以 ， 临 


协和 音程 发 生 在 


3.2 拍 频 理 论 面 
虽然 拍 频 理 


的 挑战 。 首先 是 该 理论 


位 影响 ， 这 些 因 


衡量 音乐 协和 性 的 可 靠 线索 。 其 次 ， 托 


临 的 挑战 


论 是 上 世纪 的 主流 观点 , 但 是 ， 随 着 研究 的 深入 ， 拍 频 理论 
的 外 部 效 度 ， 


界 频带 范围 实际 就 是 双 音 可 辨 
围 。Plomp 和 Levelt(1965) 计 算 , 纯音 音程 的 最 大 协和 度 发 生 在 临 
临界 宽带 值 的 25%。 
和 度 的 影响 (Bernini & Talamucci, 2014; Vencovsky, 2016)。 拍 频 理 六 
和 人 耳 内 部 生理 构造 及 活动 规律 进行 了 有 效 的 结合 。 
强调 音乐 协和 性 建立 在 一 般 感 知 水 平 上 并 且 受 听觉 加 工 系统 的 约束 。 


粗糙 感知 觉 一 一 双 音 


完全 融合 的 变化 范 


带 值 的 125%， 极 度 不 


后 续 的 研究 也 引入 了 新 算法 估计 临界 频带 对 复合 音 协 


华 的 建立 使 得 音乐 审美 感受 
与 泛音 和 谐 论 的 观点 类 似 , 拍 频 理论 也 


受到 了 前 所 未 有 


因为 拍 频 值 受 发 4 


素 在 不 同 乐器 2 


间 差 异 


频 也 不 是 引发 协和 感 的 关键 原 


E 干 涉 效应 的 声音 频率 成 分 的 振幅 和 相 


民 大 (Kohlrausch et al., 2000; Plack, 2010)。 拍 频 不 是 


Al. RAY EE} 
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(dichotic) 方 式 给 被 试 呈现 音乐 刺激 时 ， 拍 频 效 应 导致 的 粗糙 感 被 显著 降低 了 (两 个 声音 分 别 
作用 于 双 侧 耳蜗 从 而 避免 了 干涉 效应 )， 却 未 影响 音程 协和 性 的 评价 ， 说 明 拍 频 对 音乐 协和 


性 的 作用 很 小 (Bidelman & Krishnan, 2009; McDermott et al., 2010)。 更 为 有 趣 的 是 ， 按 照 拍 频 


ya 


ATI 


的 假设 相 违 。 


音 (dyads) 协 和 性 的 情况 大 量 存在 (Bowling & Purves, 2015)。 听 者 对 纯音 (不 含 泛音 )、 
只 含 少数 泛音 的 复合 音 和 含有 较 多 泛音 的 复合 音 在 协和 度 评价 上 没有 显著 差异 , 说 明 泛音 的 
有 无 及 数量 都 不 影响 协和 性 


理论 ,构成 和 弱 的 音符 越 多 ,理应 造成 更 明显 的 粗糙 感 , 但 三 音 (triads) 甚 至 四 音 (tetrads) 和 弦 


知觉 (McLachlan et al.,2013)， 这 显然 与 拍 频 理论 的 泛音 干涉 效应 


尽管 许多 研究 者 从 不 同 的 方面 指出 了 拍 频 理论 的 局 限 性 , 但 都 未 能 够 实质 性 地 否认 担 频 
对 音乐 协和 性 的 作用 ,因为 在 通常 的 情况 下 , 不 协和 音程 同时 包含 了 拍 频 较 明 显 和 泛音 不 和 
谐 两 种 特征 ， 因 此 很 难 准确 地 计算 某 一 种 因素 的 贡献 ， 也 就 很 难 拒绝 菜 一 种 理论 假设 。 


McDermont 等 人 (2010) 不 但 分 离 了 两 种 


因素 的 相互 影响 , 还 直接 计算 了 每 种 因素 与 音乐 协和 


性 的 相关 。 该 研究 分 析 了 三 个 重要 的 指标 : (1) 对 音乐 协和 性 的 偏好 ,以 被 试 对 协和 音程 与 不 


协和 音程 的 喜好 程度 差异 来 衡量 ; (2) 对 拍 频 


喜好 程度 差异 来 衡量 


: G) 对 泛音 和 谐 人 


的 厌恶 , 以 在 双 耳 分 听 与 双 耳 同 听 条 件 下 对 纯音 
的 侦 好 ， 以 对 和 谐 泛 音 与 不 和 谐 泛音 (人 为 进行 泛音 


扰动 处 理 ) 喜 好 程度 差异 来 衡量 。 结 果 表 明 ， 尽 管 被 试 并 不 喜欢 拍 频 明显 的 和 声 ， 但 对 拍 频 


的 厌恶 与 对 音乐 协和 性 的 
偏好 ， 充 分 说 明 影响 音乐 


(congenital amusia)4 


局 好 却 没 有 相关 性 , 对 和 谐 泛 音 的 偏好 显著 预测 了 对 音乐 协和 性 的 
协和 感 的 关键 性 因素 并 不 是 拍 频 的 有 无 。 另 外 ， 对 先天 性 失 音 症 
究 表 明 ， 失 音 症 病人 不 能 像 正 常 被 试 一 样 区 分 音程 协和 性 (Cousineau et 


al., 2012; Zhou et al., 2019)， 但 对 听觉 粗糙 感 的 知觉 评价 却 与 正常 被 试 无 异 ， 二 者 都 喜欢 拍 
频 不 明显 的 刺激 而 厌恶 拍 频 明 显 的 刺激 , 说 明 失 音 症 的 音乐 协和 性 加 工 缺 陷 与 拍 频 因素 无 关 
(Cousineau et al., 2012)。 总 的 来 说 ， 拍 频 理 论 一 直 强 调 没 有 粗糙 感 是 导致 音程 听 起 来 协和 的 


原因 , 却 忽略 了 协和 音程 本 身 可 能 共有 的 美学 机 理 


, 正如 Bowling 和 Purves(2015) 所 评论 的 ， 


不 苦 并 不 是 糖 吃 起 来 甜 的 原因 。 
4 生物 与 文化 的 融合 之 美 


度 上 受 生物 学 因素 影 


音乐 是 声音 组 合 的 艺术 。 不 同 国家 和 民族 都 能 以 独特 的 形式 自由 灵活 地 创作 音乐 ， 进 
而 形成 了 风格 凶 异 、 百 家 齐 放 的 音乐 文化 。 作 为 音 


乐 审美 的 核心 要 素 ， 音 乐 协和 性 在 多 大 程 


啊 有 很 大 的 争论 。 许多 研究 者 认为 , 协和 性 偏好 是 由 于 人 类 听觉 系统 对 


协和 音程 的 声学 物理 特征 存在 加 工 优势 ， 这 是 镶嵌 在 人 类 认 知 系统 的 先天 适应 性 机 制 


202110.00063v1 


chinaXiv 


(Bidelman, 2013; Bowling, et al., 2017; Virtala & Tervaniemi, 2017) 。 但 是 ， 民 族 音乐 学 家 
(ethnomusicologist) 和 作曲 家 反对 这 一 观点 , 认为 音乐 协和 性 是 后 天 习 得 的 审美 经 验 , 存在 较 
大 的 文化 差异 和 个 体 差 异 (Brown & Jordania, 2013; McDermott et al., 2016; Popescu et al., 2019). 
由 此 ， 引 发 了 音乐 协和 性 起 源 的 先天 与 后 天 之 争 。 
4.1 生物 决定 论 

持 生 物 决 定论 观点 的 学 者 认为 , 音乐 协和 性 知觉 是 人 类 与 生 俱 来 的 天 赋 才 能 。 首先, 发 
展 心理 学 的 证 据 表明 ,19 到 40 个 月 大 的 儿童 对 不 同 协和 程度 的 音乐 刺激 表现 出 明显 的 偏好 
差异 ， 他 们 花费 更 长 的 时 间 探 索 那 些 发 出 协和 音乐 声响 的 玩具 (Di Stefano et al., 2017). 6 个 


月 (Crowder et al., 1991; Trainor & Heinmiller, 1998)、 4 个 月 (Trainor et al., 2002; Zentner & 


Kagan, 1996) 甚 至 2 个 月 大 的 婴儿 (Trainor et al., 2002) 也 都 展现 出 音乐 协和 性 的 知觉 反应 能 
和 偏好 行为 。Zentner 和 Kagan(1996) 采 用 转 头 偏好 范式 考察 了 4 个 月 大 婴儿 的 音乐 协和 性 知 
觉 能 力 , 发 现在 播放 协和 音乐 时 , 婴儿 表现 出 更 少 的 头 部 运动 并 且 对 声 源 刺 激 方向 注视 更 长 
的 时 间 。 父母 是 谷 哑 人 的 婴儿 对 协和 音程 产生 强烈 的 喜爱 , 说 明 音 乐 知觉 经 验 不 是 导致 曙 儿 
形成 协和 感 的 主要 因素 , 这 就 排除 了 教养 或 环境 暴露 等 学 习 效 应 的 影响 (Masataka, 2006)。 一 
些 神经 科学 研究 甚至 发 现 , 新 生 儿 就 已 经 具有 首 乐 协和 感 ， 这 无 疑 为 音乐 审美 先天 论 的 观点 
提供 了 强 有 力 的 证 据 (Perani et al., 2010; Virtala et al., 2013)。 但 是 ， 近 期 采用 转 头 偏好 范式 的 
研究 却 未 能 够 重复 以 往 的 实验 结果 ,只 发 现 了 熟悉 性 对 协和 性 知觉 的 影响 , 因此 质疑 早期 使 
类似 范式 的 研究 可 能 混淆 了 刺激 材料 的 熟悉 性 和 新 异性 (Plantinga & Trehub, 2014)。 但 不 
管 怎样 ,这些 对 儿童 早期 的 实证 研究 至 少 说 明 音乐 协和 性 知觉 产生 与 人 类 的 生物 学 基础 存在 
着 很 大 的 关联 。 

不 同文 化 对 音阶 (scale) 的 使 用 也 佐证 了 这 一 猜测 。 人 类 在 中 等 音 闭 范 围 内 至 少 能 够 分 辩 
240 个 音 高 ， 在 原则 上 应 该 有 大 量 的 音阶 用 来 创作 音乐 ， 但 是 ， 无 论 是 西方 古典 音乐 、 现 代 
流行 音乐 、 中 国 传统 民乐 及 其 它 文 化 的 音乐 都 只 使 用 5 到 7 个 相似 的 音阶 音 级 (Bowling, et 
al., 2017; Gill & Purves, 2009)， 并 且 不 约 而 同 地 构成 了 相似 的 和 声音 程 (Bowling et al., 2017; 
Bowling & Purves, 2015)， 甚 至 不 同 国家 出 土 的 早期 乐器 也 都 只 含有 这 几 个 音阶 ， 修 缮 后 竟 
然 还 能 演奏 出 协和 音响 (Conard et al., 2009; Killin, 2018)。 这 充分 说 明 ， 先 天 的 生物 学 因素 约 
束 了 人 类 对 音阶 的 选择 ， 也 约束 了 和 声音 程 的 知觉 加 工 。 最 后 ， 两 种 主流 的 音乐 协和 性 理论 
都 支持 音乐 审美 先天 论 的 假设 。 泛 音 和 谐 论 认 为 ， 人 脑 预 装 有 自然 泛音 特征 识别 器 ,加 工 与 
之 吻合 的 有 简单 频率 比 的 协和 音程 时 会 引起 流畅 的 愉悦 体验 , 加 工 与 之 不 吻合 的 有 复杂 声学 
特征 的 不 协和 音程 会 引起 负 性 体验 。 拍 频 论 认为 , 听觉 器 官 的 生理 构造 是 导致 复杂 不 协和 音 
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程 引 起 粗糙 感 的 原因 。 所 以 , 二 者 都 强调 音乐 协和 性 是 先天 听觉 机 制 在 处 理 特定 声音 刺激 时 
引发 的 情感 效应 ， 只 不 过 前 者 认为 该 过 程 发 生 在 大 脑 的 神经 系统 ,后 者 认为 该 过 程 发 生 在 耳 


蜗 的 基底 膜 。 因此， 人 类 的 音乐 协和 性 知觉 可 能 是 一 


4.2 文化 决定 论 
民族 音乐 学 家 和 作曲 家 把 音乐 协和 性 看 作 一 


种 先天 的 音乐 才能 。 


种 审美 经 验 , 认为 文化 背景 和 后 天 音乐 训练 


塑造 了 个 体 的 音乐 协和 性 知觉 ,首先 , 和 声音 乐 的 审美 观念 在 不 同文 化 之 间 差 异 较 大 .例如 ， 
巴厘 岛 甘美 兰 (Gamelan) 音 乐 在 演奏 时 产生 非常 明显 的 拍 频 效 应 ， 这 种 引起 粗糙 感 的 音乐 形 


式 在 当地 十 分 盛行 (Harrison & Pearce, 2020; Plant 


inga & Trehub,2014)。 在 中 东 , 在 印度 北部 、 


立陶宛 、 波 斯 尼 亚 以 及 巴布亚 新 几内亚 等 地 区 ， 
调 (beat diaphony)， 说 明 拍 频 在 这 些 文化 中 被 视 


人 们 更 是 主动 追求 器 乐 乃 至 声乐 则 的 拍 频 复 
为 令 人 愉悦 的 协和 音乐 元 素 (Ambrazevicius， 


2017; Harrison, 2021; Vassilakis, 2005)。 事 实 上 ， 拍 频 效 应 的 文化 差异 被 民族 音乐 学 家 广泛 考 


UE, 但 许多 研究 者 在 撰写 结论 时 往往 忽略 了 这 些 因素 (Plantinga & Trehub, 2014)。 其 次 ， 听 者 


对 音乐 协和 性 的 知觉 评价 也 受 接触 程度 影响 。Meyer(1903) 报 告 说 ， 被 试 初次 接触 微分 音乐 


(microtonal music) 时 会 感到 很 不 协和 ， 重 复 播放 


示 听 起 来 还 不 错 。Valentine(1914) 指 出 ， 当 把 一 些 不 协和 音程 重复 听 33 人 裔 ,被 试 会 认为 它 是 


协和 的 。 不 过 ， 这 些 早 期 的 研究 报告 并 未 考虑 纯 


了 12 到 15 遍 后 ， 大 多 数 参 与 者 都 自发 地 表 


E 粹 接触 效应 (mere exposure) 的 影响 (Montoya 


etal., 2017)。 后 来 的 研究 发 现 ， 仅 仅 是 短暂 的 实验 室 训 练 就 能 够 显著 地 提 


高 被 试 对 协和 音程 


的 偏好 效应 (McLachlan et al., 2013)， 对 受过 专业 训练 的 音乐 家 来 说 ， 偏 好 效应 更 加 显著 


(Brattico et al., 2009; Dellacherie et al., 2011; McDermott et al., 2010)。 即 便 是 未 受过 音乐 教育 


的 儿童 ， 随 着 年 龄 的 增长 ， 对 音乐 协和 性 的 知觉 


ft SHE i (Weiss etal., 2020)。 这 些 来 自 跨 文 


化 、 音 乐 训练 和 毕生 发 展 的 研究 结果 都 癌 音乐 协和 性 的 生物 本 能 论 发 起 了 挑战 。 

把 这 场 争论 推 向 高 潮 的 是 2016 年 刊登 在 Nature 杂志 的 封面 文章 (McDermott et al., 2016)。 
该 文系 统考 察 了 协和 音程 偏好 在 多 大 程度 上 是 受 现代 和 声音 乐 文化 影响 。 作 者 选取 了 玻 利 维 
亚热带 雨林 中 仍然 过 着 原始 狩猎 采摘 生活 的 提 斯 曼 人 (Tsimane) 和 生活 在 城市 和 乡镇 过 着 现 
代 生 活 的 玻利维亚 人 以 及 完全 生活 在 西方 和 声音 乐 文化 下 的 美国 人 (音乐 家 和 非 音乐 家 )。 双 
果 发 现 ,虽然 提 斯 曼 人 在 声音 情感 知觉 和 音乐 粗糙 度 的 分 辩 能 力 上 与 对 照 组 相差 不 大 , 但 提 
斯 曼 人 却 给 予 协和 与 不 协和 音程 以 相同 等 级 的 愉悦 度 评 价 。 相 反 , 生活 在 城市 及 乡镇 的 玻 利 
维 亚 人 却 显 著 地 偏好 协和 音程 ,偏好 程度 依次 低 于 美国 的 非 音 乐 家 和 音乐 家 。 这 说 明 ， 音乐 


协和 感 的 形成 与 接触 现代 和 声音 乐 文化 的 程度 有 关 。 如 果 一 个 地 区 完全 没有 被 和 声音 乐 影 


S$ 
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文化 因素 在 音乐 审美 方面 起 到 了 巨大 作用 。 提 斯 曼 人 没有 聆听 或 演奏 和 声音 乐 的 经 历 ,， 他 们 
的 音乐 属于 仅 有 一 条 旋律 线 的 单 音 音乐 (Monophony)， 是 最 简单 的 音乐 形式 ， 西 方 和 声音 乐 
， 所 以 , 提 斯 曼 人 没有 形成 音乐 协和 感 可 能 是 缺乏 对 纵向 多 线 
程 音乐 的 知觉 经 验 (McDermott et al., 2016; McPherson et al., 2020)。 知 觉 磁体 效应 (perceptual 
magnet effecb 也 能 够 说 明 这 一 现象 。 婴 儿 早 期 能 够 分 辨 大 量 的 语音 范畴 ， 但 所 处 的 语言 环境 
如 果 缺 少 对 某 些 声 音 的 分 辩 要 求 (例如 日 语 中 的 “r” 和 “1”)， 在 特定 的 年 龄 后 对 这 些 声 音 
的 分 辩 能 力 就 会 消失 (Werker & Hensch, 2015)， 表 明 人 类 的 听觉 系统 会 根据 环境 的 需要 进行 


至 少 有 两 条 以 上 的 旋律 线 交 织 


调整 。 一 些 音乐 加 工 模型 也 认为 , 文化 和 经 验 通 


统 (Zatorre & Salimpoor, 2013). 
作用 的 产物 ， 而 不 是 单方 面 的 
4.3 比较 心理 学 的 介入 


过 塑造 大 脑 的 皮层 奖赏 环 路 影响 音乐 奖赏 系 


所 以 ， 音 乐 协 和 性 的 形成 极 可 能 是 神经 系统 与 文化 长 期 相互 


因素 所 致 。 


音乐 协和 性 起 源 问 题 所 以 悬而未决 , 一 个 重要 原因 是 无 法 完全 避免 先天 生物 学 因素 和 后 


天 环境 变量 的 相互 影响 , 因为 以 人 类 为 被 试 的 研究 无 法 真正 做 到 长 期 隔绝 一 切 声 音 刺 激 。 比 


较 心理 学 研究 动物 行为 ， 能 够 提供 有 效 控 人 


央 后 天 环境 接触 的 手段 (Harrison & Pearce, 2020; 


Toro & Crespo-Bojorque, 2017)。 在 实验 室 条 件 下 ， 动 物 在 出 生前 就 被 隔绝 外 部 声音 刺激 ， 所 


以 


般 听 觉 加 工 ， 而 不 是 音乐 特有 


动物 表现 出 来 的 任何 行为 人 
啊 。 动 物 不 具有 产生 音乐 的 能 力 ， 


的 认 知 加 工 。 因 此 ， 


局 好 都 可 以 排除 后 天 接触 特定 听觉 信息 (如 自然 泛音 接触 ) 的 影 
因此 ,任何 音乐 偏好 性 反应 都 可 以 视 作 是 生物 普遍 性 的 一 


比较 心理 学 是 考察 音乐 协和 性 究竟 是 先天 


性 行为 还 是 习 得 性 行为 的 重要 方法 , 也 是 理解 音乐 初始 状态 以 及 这 种 初始 状态 如 何 被 相关 经 


验 塑 造 的 重要 途径 (Toro & Crespo-Bojorque, 2017). 
类 能 力 和 偏好 行为 上 (图 2)。 研 究 表明 ， 部 分 鸟 类 和 灵 长 类 动 
物 经 过 训练 以 后 能 够 准确 地 区 分 协和 音程 和 不 协和 音程 ， 如 爪哇 禾 省 (Watanabe et al., 2005)、 


相关 的 研究 主要 集中 在 分 


显著 差异 ， 说 明 一 般 性 的 听觉 机 


il 42(Hoeschele et al., 2012). KYNE -S (Hulse et al., 1995) 和 日 本 猕猴 (zumi, 2000), 并 
能 够 将 这 种 分 类 能 力 迁 移 至 新 的 音乐 刺激 。 猴 子 的 初级 听觉 皮层 (Fishman et al., 2001) 以 及 猫 
的 听 神 经 (Tramo et al., 200D) 和 下 丘 (McKinney et al., 2001) 对 协和 与 不 协和 音程 的 神经 反应 有 


剖 是 导致 某 些 动物 掌握 音乐 协和 性 分 类 能 力 的 重要 原因 。 研 


完 还 发 现 ,一 些 动物 幼 叫 能 够 立即 表现 出 音乐 协和 性 的 侦 好 行为 。 例 如 ,， 刚 旷 化 的 小 鸡 会 对 


播放 有 协和 旋律 的 视觉 印记 表现 出 明显 的 接近 行为 (Chiandetti & Vallortigara, 2011)。 黑 猩猩 


幼 串 也 更 喜欢 通过 连接 在 它 胸 


上 接近 的 黑猩猩 共享 音乐 协和 


膊 上 的 装置 播放 协和 音乐 旋律 , 提示 人 类 可 能 与 同 在 系统 发 育 
性 的 进化 起 源 (Sugimoto et al., 2010)。 但 是 ， 当 使 用 孤立 的 和 
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声音 程 为 刺激 时 ,棉花 项 面 绢 毛 猴 在 V A E PIERE BT BETS ER ET] (Koda 
et al.,2013)。 与 之 相反 ， 人 类 的 音乐 协和 性 偏好 不 仅 在 完整 旋律 条 件 下 显著 ， 也 在 孤立 和 声 
的 情况 下 存在 (McDermott et al., 2010; Toro & Crespo-Bojorque, 2017)， 说 明 较 少 的 音乐 信息 
对 比 可 能 不 足以 引起 某 些 非 类 人 猿 灵 长 类 动物 的 音乐 协和 性 知觉 。 

为 了 排除 动物 自身 叫 声 的 影响 ， 研 究 者 采用 吗 齿 类 动物 如 褐 家 鼠 为 研究 对 象 (Crespo- 
Bojorque & Toro, 2015; Postal, et al.,2020)。 因 为 与 大 多 数 常 发 出 和 谐 泛音 叫 声 的 动物 不 同 ， 
褐 家 鼠 的 叫 声 一 般 不 具有 和 谐 泛音 特征 , 在 多 数 情况 下 是 纯音 样 的 超声 波 , 这 就 为 验证 泛音 
和 谐 性 的 知觉 接触 理论 控制 了 自身 叫 声 这 一 混淆 变量 。 研究 发 现 , 即便 褐 家 鼠 在 强化 训练 下 
习 得 了 分 辨 协和 音程 与 不 协和 音程 的 能 力 , 但 不 能 泛 化 至 其 他 新 的 音程 刺激 , 也 不 能 迁移 至 
倍 频 转换 (octave transpositions) 音 程 条 件 ， 说 明 褐 家 鼠 只 是 暂时 记 住 了 音程 间 的 绝对 频率 差 
异 。 导 致 褐 家 鼠 不 具有 音乐 协和 性 知觉 能 力 的 原因 可 能 是 缺乏 和 声音 乐 或 和 谐 泛音 的 接触 经 
验 (Crespo-Bojorque & Toro, 2015; Toro & Crespo-Bojorque, 2017)。 未 来 研究 可 以 让 褐 家 鼠 自 
出 生前 就 暴露 在 这 些 声学 线索 中 , 以 考察 接触 经 验 是 否 对 音乐 协和 性 偏好 有 塑造 作用 .总 之 ， 
比较 心理 学 是 理解 音乐 知觉 如 何 受 后 天 文化 环境 票 陶 的 重要 手段 。 而 且 , 音乐 协和 性 也 并 非 
为 人 类 所 特有 ， 一 些 动物 与 人 类 在 发 音 -听觉 系统 可 能 存在 相似 的 进化 起 源 。 


; 
, Cotton-top tamayin 


apanese macaque Chickadee 


Dissonance 


图 2 不 同 物种 对 协和 与 不 协和 音乐 的 分 辩 能 力 和 偏好 反应 的 实验 结果 总 结 


4.4 多 因素 混合 理论 
为 了 弥合 音乐 协和 性 理论 中 的 先天 论 与 后 天 论 之 争 , 一些 研究 者 提出 了 整体 性 概念 结构 
里 论 ， 认 为 生物 学 因素 与 文化 因素 共同 影响 音乐 协和 性 知觉 。 其 中 ， 和 谐 泛音 列 是 引起 协和 


感 的 主要 因素 , 拍 频 效 应 是 导致 不 协和 感 体验 的 主要 原因 , 经 验 和 文化 通过 审美 观念 自 上 而 


HL 


下 地 调节 音乐 协和 性 知觉 (Friedman et al., 2021; Parncutt & Hair, 2011; Parncutt et al., 2019). 


Bowling 等 人 (2017) 认 为 ， 忽 视 生物 因素 或 环境 信息 的 任何 一 方 都 无 法 准确 说 明 音乐 协和 性 
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的 产生 ， 所 以 多 因素 混合 理论 是 解释 音乐 协和 性 产生 的 最 佳 方式 。 最 有 说 服 力 的 证 据 来 自 


Harrison 和 Pearce(2020) 归 纳 的 混合 计算 模型 。 他 们 习 


Wp 


新 评估 了 此 前 分 别 基 于 泛音 和 谐 性 、 


拍 频 效应 以 及 文化 特征 三 种 因素 理论 的 几 种 经 典 模型 的 预测 力 , 发 现 尽 
音乐 协和 性 的 有 效 指标 。 MH, 重新 拟 
合 一 个 同时 包含 这 些 因素 的 混合 计算 模型 以 后 ， 预 测 力 提高 至 88.95%， 显 车 大 于 此 前 所 有 
的 单 因 素 计算 模型 。 作 者 还 利用 音乐 语料库 分 析 法 ， 考察 了 过 去 千年 间 的 10000 ABTS. Bt 


的 模型 在 预测 力 上 存在 着 差异 , 但 三 种 因素 都 是 衡量 


管 依 据 不 同 理论 建立 


士 和 流行 音乐 作品 的 和 弦 流 行 性 (chord prevalence)。 结 果 发 现 ， 泛 音 和 谐 性 对 和 弦 流 行 性 的 


预测 有 显著 的 正 相 关 , 拍 频 效应 与 和 弦 流 行 性 呈 显 著 的 负 相 关 , 说 明 一 直 以 来 作曲 家 都 更 青 


睐 在 创作 中 添加 泛音 和 谐 的 音乐 元 素 , 尽量 避免 使 用 那些 可 能 引发 听众 不 愉悦 情绪 的 粗糙 感 


元 素 ， 再 次 证 实 音乐 协和 性 同时 受到 拍 频 效应 和 泛音 1 


办 和 性 影响 。 综 上 , 音乐 协和 性 是 由 多 


种 因素 引起 的 音乐 审美 知觉 , 未 来 研究 应 该 试图 分 离 这 些 因素 的 相互 作用 ， 以 确定 加 工 这 些 


言 息 是 否 存 在 共享 的 神经 通路 。 


5 音乐 协和 性 的 认 知 神经 机 制 | 


近 20 年 来 ， 随 着 认 知 神经 科学 的 发 展 ， 借 助 神经 电 生理 (如 ERP) 和 脑 成 像 (如 fMRI) 


技术 , 研究 者 在 解析 音乐 协和 性 的 认 知 加 工 机 制 方面 


取得 重要 进展 。 大 量 的 证 据 表 明 ， 人 脑 


对 和 声音 程 的 加 工 遵循 自 下 而 上 的 加 工 模式 , 与 音乐 协和 性 相关 的 音 高 信息 在 传 入 高 级 皮层 


之 前 就 已 经 被 初步 处 理 , 这 些 初 期 感觉 编码 形式 遵循 高 水 平 的 音乐 层级 规则 , 而 非 简 单 的 声 
学 物理 特征 , 说 明 音乐 协和 性 的 认 知 体验 基于 感觉 水 平 的 神经 活动 (Bidelman, 2013; Bidelman 


& Grall, 2014; Bidelman & Heinz, 2011; Bidelman & Krishnan, 2009; Bones et al., 2014; Itoh et 


al., 2010; Kim et al., 2017)。 在 早期 注意 阶段 ， 初 级 和 次 级 听觉 皮层 负责 音 高 信息 的 抽象 表 


征 (Bidelman & Grall, 2014; Itoh et al., 2010)， 在 更 早期 的 前 注意 阶段 (pre-attentive stages), Z 


层 下 组 织 结构 (如 脑 干 和 听 神 经 ) 中 神经 元 群 的 锁 相 活动 是 编码 音 高 信息 的 认 知 通路 起 源 


(Bidelman, 2013; Bidelman & Heinz, 2011; Bidelman 


& Krishnan, 2009; Bones et al., 2014; 


Proverbio et al., 2017)。 因 此 ， 音 乐 协 和 性 认 知 偏好 在 皮层 和 皮层 下 水 平均 具有 生物 学 基础 。 


Itoh 等 人 (2010) 利 用 ERP 技术 验证 脑 电 信号 反应 与 音 


实验 任务 是 向 被 试 随机 呈现 跨度 分 布 范 围 在 0-13 个 半音 的 和 声音 程 ， 发 现 200-300ms 左右 


乐 协和 性 的 等 级 顺序 存在 紧密 关联 , 该 


诱发 的 N2 成 分 显著 地 受 音程 协和 性 高 低调 节 , 不 协和 音程 相 较 于 协和 音程 诱发 了 波幅 更 大 


的 N2， 构 成 和 声音 程 的 两 个 音符 音 高 之 比 越 简单 ， 诱 发 的 N2 波幅 就 越 小 ， 极 度 符合 简单 
È 


频率 比 学 说 的 预测 , Wi HAKAA E IAE) AE 


中 的 音 高 关系 非常 敏感 , 表 


= 


这 些 音 程 
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EERI SUS bate a BK SEI DPE I — B. He 


索引 发 的 瞬 态 特异 性 神经 信号 


一 一 音 高 起 始 反应 (pitch onset response) 的 波幅 变化 也 与 行为 结果 及 音乐 协和 性 的 等 级 顺序 


致 ， 再 次 证 明 音乐 协和 性 知觉 建立 在 低 水 平 的 神经 反应 上 ， 


而 且 早期 编码 形式 就 已 经 采用 


了 高 水 平 的 音乐 组 织 原 则 (Bidelman & Grall, 2014)。 言 语 加 工 过 程 的 语音 编码 (phonetic code) 


模式 也 与 之 相似 , 初级 听觉 皮层 及 其 邻近 区 域 对 言语 信息 的 早 
级 抽象 规则 而 非 简单 的 声学 特征 (Scharinger et al., 2011)， 提 示 


经 基础 。 


期 加 工 同样 遵循 语音 信息 的 高 
音乐 和 语言 可 能 共享 特定 的 神 


在 皮层 下 水 平 , 研究 者 以 频率 跟随 响应 (frequency-following response, FFR) 为 指标 发 现 音 


乐 协和 性 的 认 知 通路 可 能 起 源 于 脑 干 (Bidelman, 2013; Bidelman & Heinz, 2011; Bidelman & 


Krishnan, 2009; Bones et al., 2014)。FFR 是 周期 性 声音 刺激 诱 


发 产生 的 听觉 脑 干 稳 态 响应 ， 


反映 脑 干 神经 元 群 对 周期 性 声音 刺激 时 间 细 节 结 构 (temporal fine structure) 的 同步 锁 相 活动 ， 


因此 ， 利 用 FFR 能 够 清晰 地 记录 和 比较 脑 干 对 不 同 协和 程度 


音乐 刺激 的 同步 锁 相 能 力 差 异 


(Bidelman, 2013; Bidelman & Krishnan, 2009; Bones et al., 2014; Coffey etal.,2016)。 研 究 发 现 ， 
协和 音程 比 不 协和 音程 诱发 更 稳健 且 同 步 性 水 平 更 高 的 相位 锁定 信号 (协和 音程 在 基 频 和 倍 
频 处 诱发 的 频谱 能 量 幅 度 更 大 且 更 集中 )， 信 和 号 幅 值 与 被 试 的 评定 结果 及 音乐 协和 性 的 等 级 


程度 显著 相关 , 说 明 脑 干 神经 元 群 的 锁 相 活动 中 储存 了 关于 音 


et al., 200D) 和 下 丘 (McKinney et al., 2001) 等 区 域 对 协和 音程 表 


乐 协和 性 音 高 等 级 关系 的 感觉 


言 息 ， 并 以 此 作为 最 初 的 编码 模式 (Bidelman & Krishnan, 2009)。 动 物 研究 发 现 ， 脑 干 (Tramo 


现 出 更 稳健 的 同步 锁 相 活动 ， 


并 且 能 够 有 效 地 预测 动物 的 音程 偏好 行为 。 所 以 ， 人 类 和 动物 的 研究 都 表明 ,协和 音程 在 听 
觉 系 统 中 存在 编码 优势 。 这 也 说 明 ， 相 较 于 周期 性 不 规则 的 不 协和 音程 ， 皮 层 下 神经 元 群 对 
协和 音程 声学 特征 的 同步 锁 相 能 力 更 强 ， 这 在 很 大 程度 上 降低 了 大 脑 的 计算 负荷 。 换 言 之 ， 


音乐 协和 性 知觉 偏好 差异 反映 了 听觉 系统 对 音 高 层级 信息 表征 能 力 的 神经 生物 学 差异 。 总 
之 ， 发 生 在 皮层 水 平 的 更 高 级 的 音乐 愉悦 感 体 验 建 立 在 皮层 下 水 平 的 神经 反应 基础 上 。 
大 脑 的 高 级 认 知 区 域 也 参与 音乐 协和 性 的 知觉 加 工 。Minati 等 人 (2009) 表 明 ， 协 和 和 弦 


比 不 协和 和 弦 在 额 叶 中 下 回 (inferior and middle frontal gyrD)、 前 运动 皮层 (premotor cortex) 和 


顶 下 叶 (inferior parietal lobule) 等 区 域 诱发 更 强 的 血 氧 动力 学 信 


号 响应 ， 非 音乐 家 被 试 的 激活 


水 平 表现 出 明显 的 右 侧 化 优势 ， 音乐 家 未 表现 出 明显 的 偏 侧 化 。 但 是 ，Foss 等 人 (2007) 的 研 


究 却 发 现 相 反 的 音乐 协和 性 效应 , 不 协和 音程 比 协 和 音程 在 非 


音乐 家 的 右 侧 额 下 回 以 及 音乐 


家 的 前 扣 带 回 (anterior cingulate cortex), #i_LJ=l(superior temporal gyrus)、 左 侧 额 叶 中 下 回 和 


顶 下 叶 等 区 域 的 激活 水 平 更 强 。 导 致 这 种 不 一 致 的 结果 可 能 是 实验 任务 和 刺激 材料 不 同 , 前 
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者 采用 四 音 和 弦 为 刺激 ， 并 要 求 被 试 判 断 每 个 和 弦 的 协和 性 (Minatietal., 2009)， 后 者 使 用 双 


音 和 声 ， 被 试 只 需要 被 动 地 听 (Foss etal., 2007)。 此 外 ， 在 一 项 系统 平衡 了 音 


符 数量 、 音 


节奏 及 旋律 轮廓 的 研究 中 ， 不 协和 音程 比 协和 音程 在 内 侧 前 额 叶 (medial prefrontal cortex) 和 
前 扣 带 回 吃 部 等 区 域 的 激活 水 平 更 高 (Bravo etal., 2020)。 有 趣 的 是 ， 这 些 脑 区 是 负责 冲突 检 


测 及 评估 负 性 情绪 和 鸭 惧 相关 信息 


的 脑 区 , 而 且 


在 不 协和 条 件 下 , 双 侧 初级 听觉 皮层 与 扣 带 


oy 


回 之 间 的 功能 连接 更 强 , 说 明 大 脑 在 处 理 


不 协和 音程 具有 明显 的 负 性 效 价 信息 特征 。 


的 奖赏 价值 (Gold et al., 2019; Zatorre & Salimpoor, 2013)。 


prediction errors) 范 式 的 研究 发 现 ， 以 协和 音 


不 协和 音 


程 ars 


E24 GE 


乐 时 需要 更 多 的 信息 资源 参与 , 也 证 实 了 


与 之 相反 , 协和 音程 引发 的 正 性 愉悦 体验 有 极 高 


一 项 采用 预测 奖赏 错 


误 (reward 


尾 的 音乐 令 被 试 产生 民 动 机 性 学 习 行 为 , 并 


且 像 美食 和 金钱 一 样 激活 中 脑 多 巴 胺 奖赏 系统 的 核心 一 一 伏 隔 核 nucleus accumbens)(Gold 


et al., 2019). 
路 。 
以 上 的 而 


KRH, 音乐 协和 性 信息 


因此 ， 大 脑 高 级 皮层 对 协和 音程 与 不 协和 音程 的 加 工 可 能 存在 着 不 同 的 认 知 通 


能 够 诱发 皮层 下 前 注意 水 平 的 基础 神经 反应 , 也 能 
够 调动 高 级 水 平 的 认 知 资源 参与 ,甚至 能 够 激活 奖赏 系统 和 影响 执行 功能 。 两 种 认 知 水 平 的 


表征 均 受 音乐 训练 影响 (Andermann, et al., 2020; Bidelman & Heinz, 2011; Foss et al., 2007; Itoh 


et al., 2010; Minati et al., 2009; Pages-Portabella & Toro, 2020; Proverbio et al., 2016)， 这 说 明 ， 


音乐 经 验 对 音乐 协和 性 的 知觉 加 工具 有 塑造 作用 。 未 来 研究 应 该 探讨 不 同音 乐 文化 背景 如 何 


自 上 而 下 的 调节 音乐 协和 性 的 神经 机 制 。 
6 研究 展望 

音乐 具有 传情 达意 的 作用 ， 
绪 的 关键 元 素 。 相 关 文 献 已 经 在 理论 


能 够 引起 听 者 强烈 的 情绪 体验 。 
观点 和 研究 方法 上 有 了 较 大 的 突破 , 但 仍然 存在 着 许多 


音乐 协和 性 是 连接 音乐 与 情 


尚 需 解 决 的 问题 ，(1) 什 么 样 的 声学 特 
加 工 这 些 特 征 的 能 力 ? (3) 为 什么 人 类 把 这 


oO 


针对 问题 一 ， 最 值得 关注 的 是 泛音 和 谐 性 


征 导 致 和 声 


音程 被 认为 是 协和 的 ? (2) 人 类 如 何 进 化 出 


声学 特征 赋予 了 相应 的 审美 属性 ? 


调和 ,近期 的 而 


知 活动 对 音乐 协和 性 的 影 


知觉 Friedman et al., 2021; Harrison & Pearce, 2020)。 但 这 也 引发 了 诸多 疑问 。 


与 拍 频 效 应 的 理论 之 争 。 然 而 ， 二 者 并 非 不 可 
完结 果 都 相继 支持 了 多 因素 混合 理论 的 假设 , 认为 二 者 共同 决定 音乐 协和 性 


譬如 ， 两 种 认 


啊 哪 一 个 作用 更 大 ? 二 者 引起 的 协和 性 知觉 效果 是 否 截然 相反 , 即 


前 者 主要 负责 引发 协和 感 


,后 者 主要 导致 不 协和 感 ? 最 初 的 信息 
还 是 发 生 在 基底 膜 ? 未 来 研究 应 该 寻找 新 的 范式 分 


编码 形式 是 发 生 在 神经 系统 
离 这 两 个 因素 。 针 对 问题 二 , 语音 相似 性 
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假设 和 比较 心理 学 证 据 都 提供 了 较 好 的 回答 , 对 协和 音程 偏好 反映 了 听觉 系统 对 自然 和 谐 泛 


音 特征 以 及 同类 嗓音 相似 性 特征 的 神经 生物 学 倾向 , 但 对 不 协和 音程 排斥 的 生物 学 原因 还 并 
不 清楚 。 此 前 的 研究 表明 , 粗糙 感 极 为 明显 的 尖 叫 声音 能 够 直击 大 脑 的 恐惧 中 枢 一 一 杏仁 核 


A 


(Arnal etal.,2015)， 人 类 很 可 能 把 厌恶 情绪 泛 化 至 所 有 具有 明显 粗糙 感 的 声音 特征 。 未 来 研 


究 可 以 分 析 不 协和 音程 在 诱发 负 性 情绪 方面 是 否 遵 循 相似 的 演化 规律 和 认 知 模式 。 问 题 三 要 


比 前 两 个 问题 更 加 复杂 ,因为 音乐 协和 性 知觉 是 否 在 人 类 社会 中 普 裔 存在 尚 有 和 争议, 除了 受 


-ye 


先天 因素 约束 外 ， 经 验 塑 造 及 文化 票 陶 同样 扮演 着 重要 角色 ， 甚 至 有 人 认为 ， 人 类 根本 就 没 
有 进化 出 任何 音乐 审美 能 力 , 对 音程 的 喜爱 或 排斥 只 是 长 期 受 西 方 现代 和 声音 乐 规范 影响 的 
结果 。 一 些 未 接触 过 西方 音乐 文化 的 群体 就 未 表现 出 协和 性 的 审美 偏好 (McDermott et al., 


2016)， 一 些 地 区 甚至 盛行 不 协和 的 拍 频 复 调 音乐 (Ambrazevigius, 2017; Vassilakis, 2005)。 所 


以 ， 人 类 为 何 将 一 些 声学 特征 赋予 相应 的 审美 属性 仍然 值得 进一步 思考 。 此 外 ,中 国 传统 民 
族 音乐 共有 偏重 旋律 变化 而 轻视 和 声 作用 的 特点 , 在 乐器 样式 、 音 乐 形式 和 文化 内 涵 等 六 


A 


都 与 西方 音乐 存在 较 大 差异 。 研 究 者 可 以 基于 音乐 库 分 析 法 , 考察 中 国民 族 音 乐 在 未 接触 西 
方 音乐 前 具有 怎样 的 和 声 知觉 观念 , 这 或 许 有 助 于 理解 人 类 为 何 会 形成 当前 的 和 声音 乐 审美 
特征 ,而 且 , 中国 是 一 个 民族 众多 的 国家 , 强 含 着 大 量 多 声 部 音乐 形态 的 少数 民族 音乐 文化 ， 


如 侗族 大 歌 和 壮族 山歌 等 , 这 些 多 声 部 音乐 在 音程 协和 性 的 表现 手法 上 有 是否 与 西方 和 声 


音乐 


存在 着 异曲同工 之 妙 ? 相应 的 ,民族 文化 又 如 何 塑造 这 些 群 体 的 音乐 审美 特征 ? 近期 , 由 意 
大 利和 尼泊尔 政府 联合 开展 的 喜马拉雅 山脉 二 城 章 亮 峰 科 考 项 目 发 现 , 影响 音乐 协和 性 的 关 


键 因素 是 音乐 文化 票 陶 ， 与 海拔 高 度 、 人 口 特征 及 民族 身份 无 关 (Prete et al., 2020)。 因 此 ， 


深入 探 完 一 些 音乐 文化 较为 浓厚 的 多 声 部 少数 民族 音乐 , 有 利于 阐明 文化 对 音乐 协和 性 审美 


观念 的 塑造 作用 。 


国内 对 音乐 协和 性 的 研究 主要 集中 在 史实 描述 、 作 品 分 析 和 审美 思辩 等 方面 , 具有 较 强 


的 主观 性 和 个 人 风格 ,几乎 很 难 见 到 实证 性 的 文章 , 主要 原因 与 国内 音乐 学 与 其 它 学 科 的 交 
流 度 不 高 有 关 。 相 较 之 下 , 国外 对 音乐 协和 性 的 研究 成 果 颇 丰富 , 涉及 声学 分 析 、 毕生 发 展 、 
音乐 训练 、 文 化 经 验 以 及 动物 行为 等 多 方面 的 实证 性 考察 , 并 结合 认 知 神经 科学 探索 音乐 协 


和 性 的 脑 与 认 知 神经 机 制 ， 为 理解 音乐 的 基本 原理 提供 了 极 丰富 的 资料 。 事 实 上 ， 中 国 早 在 


春秋 时 期 就 建立 了 与 古 希 腊 相 似 的 简单 整数 比 的 音乐 思想 ( 陈 思 ， 陈 其 射 ，2019; BRA 


f, 


2018)。 甚 至 在 律 学 方面 ， 明 代 的 朱 载 博 率先 利用 自制 的 八 十 一 档 双 排 大 算盘 计算 出 “ 


= 


FHE”, 这 比 欧洲 的 同样 成 果 早 了 近 半 个 世纪 。 令 人 遗憾 的 是 ， 朱 载 博 的 成 果 在 当时 并 未 
引起 重视 , 而 十 二 平均 律 在 西方 一 经 提出 就 迅速 得 到 了 推广 , 并 革新 了 乐器 制造 工艺 技术 和 
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相应 的 作曲 理论 (Chow, 2020; Jerold et al.,2016; 孙 铀 亮 ,2017)。 所 以 ， 现 代 西 方 乐 器 具有 律 
制 规整 ,泛音 协调 ， 音 响 统 一 的 特点 。 中 国民 族 乐器 却 在 音响 上 个 性 鲜明 ， 声 学 复杂 ， 且 缺 
少 低音 乐器 ， 因 而 不 适合 进行 大 规模 的 交响 合奏 。 直 至 今日 ， 中 国民 乐 也 未 能 够 形成 完整 的 
音乐 协和 性 理论 。 我 们 应 当 正 视 这 种 差距 。 尽 管 民乐 从 未 停止 过 交响 化 的 尝试 与 探索 , 但 在 
乐器 改革 的 热潮 下 却 出 现 了 一 些 “ 全 盘 西 化 ”的 极端 做 法 ( 唐 朴 林 ，2010)， 当 然 也 存在 反对 
的 声音 ， 认 为 中 国 音乐 具有 独特 的 审美 价值 ， 不 应 该 以 西方 的 标准 来 评价 ， 民 乐 追求 的 就 应 
当 是 曲 高 和 寡 、 高 山 流水 的 意境 。 但 是 , 科学 不 分 东西 , 西方 交响 音乐 发 展 也 是 改革 的 结果 ， 
旦 改革 的 方向 却 是 受 实证 科学 的 牵引 , 通过 大 量 的 心理 声学 和 生理 声学 的 实证 研究 建立 了 相 
MAN SR PER, FFAS ZH 
调 的 是 , 本 文 只 从 音乐 协和 性 这 一 基本 听觉 音乐 现象 角度 指出 科学 研究 的 必要 性 , 不 对 音乐 
多 式 和 艺术 手法 提出 任何 看 法 。 中 西方 音乐 各 具 特 色 , 但 多 线程 的 和 声音 乐 无 疑 是 未 来 音乐 
发 展 的 必 经 之 路 。 


O 


点 用 于 实际 创作 (Bennett, 2018; Chan et al., 2019)。 需 要 强 


区 
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Abstract 


Music is an advanced activity of human cognition and one of the universal ways of emotional 
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expression in life. As the core element connecting music and emotion, the rationale for simultaneous 
consonance is still unsolved. The core of this problem is how our brain possesses musical chords 
composed of several tones and why some tone combinations sound relatively pleasant (consonance) 
while others sound unpleasant (dissonance). This question has fascinated scholars since the ancient 
Greeks. Physicists have been trying to find answers to the differences between acoustic features of 
consonance and dissonance harmony. Biologists argue that consonance perception is the basic 
emotional experience evoked by sound events in the auditory system. Psychologists are more 
inclined to examine whether musical consonance perception is nature or nurture. Although musical 
consonance has been researched mainly using western theoretical perspectives, studying musical 


consonance in Chinese traditional music culture is urgently needed. 
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